第6章 日本語DNN音声合成システムの実装
日本語音声合成のフロー(図6-1)
テキスト
→テキスト解析
#pyopenjtalk
→継続長モデル
→音響モデル
→ボコーダ
#pyworld
レシピ=「実験を再現可能な形でまとめたシェルスクリプト群」(p.134)
#ESPnet
でも使われる意味合い
学習用コーパス JSUT
basic5000
ProcessPoolExecutor
#hydra
を使ったサンプルコード
stage 6
DNN
LSTM
疑問:DNNTTSはDNNを使っているのか、LSTMなのか
TODO:ttslearn.dnntts.gen を見る